    Depression and Anxiety Detection from Blog Posts Data

    Depressioon ja ärevus mõjutavad paljude inimeste elu ja kui diagnoos ei ole õigeaeg-selt määratud, võib see kaasa tuua märkimisväärseid terviseprobleeme ja isegi suitsiidi. Tänapäeval uurivad vaimse tervise spetsialistid ja andmeteadlased meetodeid, kuidas sotsiaalmeedia ja eriti avalikult kättesaadavate tekstisõnumite ja blogitekstide analüüsimise abil depressioonis inimesi tuvstada ja pakkuda neile vajalikku ravi ja toetust. Selles töös kogume eksperimentaalse andmestiku avalikult kättesaadavatest blogipostitustsest, mis koosneb nii kliinilisest kui ka kontrollgrupi postitustest. Kliiniline grupp koosneb autoritest, kes kannatavad depressiooni ja/või ärevuse all, kontrollgrupp koosneb tervetest isikutest, kes oma blogis kirjutavad depressiooni ja ärevuse teemadel. Töös leiame kogutud andmetes sisalduvad latentsed teemad ja analüüsime blogipostituste sisu vastavaltblogi autorite poolt kajastatud teemadele. Katsetame mitmete teksti kodeerimismeetoditega nagu sõnahulk (BOW), TFIDF ja teemamudelist tuletatud tunnused. Treenime tugivektormasinatel (SVM) ning konvolutsioonilistel närvivõrkudel (CNN) põhinevaid klassifikaatoreid kliinilisse ja kontrollgruppi kuuluvate autorite eristamiseks. Lisaks uurime, kuidas mõjutavad erineva pikkusega blogipostitused CNN’i klassifitseerimistäpsust. Parimad täpsuse ja saagise skoorid vastavalt 78% ja 0,72 saadi konvolutsioonilise närvivõrgu (CNN) klassifikaatoriga, mis oli initsialiseeritud eeltreenitud GloVe sõnavektoritega.Depression and anxiety affect the life of many individuals and if the diagnosis is notstated in time it could lead to considerable health decline and even suicide. Nowadays,mental health specialists, as well as data scientists, work towards analyzing socialmedia sources and, in particular, publicly available text messages and blogs to identifydepressed people and provide them with necessary treatment and support. In this work,we adopt an experimental data collection approach to gather a corpus of blog posts fromclinical and control subjects. Ill people are considered as clinical subjects while controlsubjects refer to healthy individuals. We inspect the latent topics found in collecteddata to analyze the blog’ content according to themes covered by blog authors. Weexperiment with various text encoding techniques such as Bag-of-Words (BOW), TermFrequency-Inverse Document Frequency (TFIDF) and topic model’s features. We applySupport Vector Machines (SVM) and Convolutional Neural Network (CNN) classifiersto discriminate between clinical and control subjects. Additionally, we explore theclassification performance of CNNs trained on blog post texts of different size. Thebest accuracy and recall scores of 78% and 0.72 respectively were obtained with aConvolutional Neural Network (CNN) classifier initialised with pretrained GloVe wordvector


    Services accessible through a web interface have become an integral part of the modern world. With the growing number of Web applications, their maintenance and administration are becoming an increasingly difficult task. Thus, sooner or later almost any organization faces the task of integrating these services.The best solution to the problem described above is to deploy a corporate portal that will provide centralized access to all web services in the organization.The vast majority of Web application developers use the enterprise portal Liferay, which is a powerful and modern open-source platform, to solve these problems. Currently, it is one of the most popular solutions for building corporate portals.However, developers have a problem with the availability of materials and documentation that would fully reveal the full range of possible implementation of the functionality of the platform.Therefore, there is a need for a detailed analysis of the functionality and implementation examples based on the Liferay portal for the development of Web applications.The article analyzes the basic principle of Web application development, its implementation in the researched corporate portal Liferay, as well as in the modules available to developers. The functionality of the Liferay Digital Experience Platform (DXP) project development tool is revealed.The basic structure of the main components of the portal for the development of corporate tasks Liferay is analyzed and based on this information, effective examples of implementation of these components are analyzed, which can be used to create a structure of Web-applications of any type and with any tasks.Сервисы, доступные через веб-интерфейс, стали неотъемлемой частью современного мира. В связи с ростом числа Web-приложений, их поддержка и администрирование становится все более сложной задачей. Таким образом, рано или поздно практически перед любой организацией стоит задача интеграции этих сервисов.Оптимальным вариантом решения описанной выше проблемы является развертывание корпоративного портала, который обеспечит централизованный доступ ко всем веб-сервисам организации.В подавляющем большинстве разработчики Web-приложений для решения указанных задач используют корпоративный портал Liferay, который является мощной и современной платформой с открытым исходным кодом. В настоящее время является одним из наиболее популярных решений при построении корпоративных порталов.Но у разработчиков возникает проблема с наличием в свободном доступе материалов и документации, которая в полной мере раскрывала весь возможный спектр реализации функционала платформы.Следовательно, существует необходимость в детальном анализе функционала и примеров реализации на основе портала Liferay для разработки Web-приложений.В статье проведен анализ базового принципа разработки Web-приложений, его реализацию в исследуемом корпоративном портале Liferay, а также в доступных для разработчиков модулях. Раскрыто функционал инструмента для разработки проектов Liferay Digital Experience Platform (DXP).Проанализирована базовая структура основных компонентов портала для разработки корпоративных задач Liferay и на основе этой информации проанализированы эффективные примеры реализации этих компонентов, которые можно применять для создания структуры Web-приложений любого типажа и с любыми задачами.Сервіси, доступні через веб-інтерфейс, стали невід’ємною складовою частиною сучасного світу. У зв’язку зі зростанням числа Web-додатків, їх підтримка і адміністрування стає все більш складним завданням. Таким чином, рано чи пізно практично перед будь-якою організацією постає завдання інтеграції цих сервісів.Оптимальним варіантом вирішення описаної вище проблеми є розгортання корпоративного порталу, який забезпечить централізований доступ до всіх веб-сервісів організації. В переважній більшості, розробники Web-додатків для вирішення зазначених задач використовують корпоративний портал Liferay, який є потужною та сучасною платформою з відкритим вихідним кодом. На теперешній час є одним з найбільш популярних рішень при побудові корпоративних порталів. Але у розробників виникає проблема із наявністю у вільному доступі матеріалів та документації, яка б у повній мірі розкривала весь можливий спектр реалізації функціоналу платформи. Отже, існує необхідність в детальному аналізі функціоналу та прикладів реалізації на основі порталу Liferay для розробки Web-додатків.В статті проведено аналіз базового принципу розробки Web-додатків, його реалізацію в досліджуваному корпоративному порталі Liferay, а також в доступних для розробників модулях. Розкрито функціонал інструменту для розробки проектів Liferay Digital Experience Platform (DXP). Проаналізована базова структура основних компонентів порталу для розробки корпоративних задач Liferay і на основі цієї інформації проаналізовані ефективні приклади реалізації цих компонентів, які можна застосовувати для створення структури Web-додатків будь-якого типажу і з будь-якими задачами